<?php
include("CrawlerURL4399.php");
include("ParseContent4399.php");
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title><?=$sitename?> | <?=$sitenameadd?></title>
<meta name="keywords" content="<?=$sitename?>" />
<meta name="description" content="<?=$sitedescription?>" />
<base href="<?=$baseurl?>">
<link href="main.css" rel="stylesheet" type="text/css" />
</head>
<body>
<?php
ignore_user_abort();           // 即使Client断开(如关掉浏览器)，PHP脚本也可以继续执行.
set_time_limit(0);             // 执行时间为无限制，php默认的执行时间是30秒，通过set_time_limit(0)可以让程序无限制的执行下去
//echo __FILE__; 
//通过修改index.php 中 
//$category=二级目录（游戏类别）的url
//$cname=游戏类别名称
//可以采集不同类别下的游戏
//访问 index.html开始采集。

//类别目录下面匹配游戏页面url的正则	
$urlpattern = "<p><a href='(.*?)'>";

//一个类别页面的url，并且把分类写入数据库,返回一个分类id
$category = "http://www.4399.com/flash_fl/2_1.htm";
$cname="动作";
$in = new InsertDate();
$cid = $in->insertCategory($cname);


//采集出类别页面的全部游戏地址
$c = new CrawerURL4399();
$urls = $c->parseURLS("$category", $urlpattern);

$p = new ParseContent4399();

//匹配每个游戏属性的正则表达式数字
$regs = array("name" =>"游戏名:<\/strong>(.*?)<\/li>", 
			 "type" =>"分类:<\/strong>(.*?)<\/li>",
             "date" =>"日期:<\/strong>(.*?)<\/li>",
             "size" =>"大小:<\/strong>(.*?)<\/li>",
             "introduce" =>"<!--键盘操作指南-->([\s\S]*?)<center",
             "pfurl" =>"<div class=\"lim\"><a href='(.*?)' target=\"_self\">(.*?)src='(.*?)'(.*?)<\/a><\/div>");

//采集出上面一个类别下的全部游戏url的详细信息
$p->parseAllContent($urls, $regs,$cid);
?>
</body>
</html>
